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摘要 : [目的 /意义 ] 当前 ,国内 引文 数据 库 建 设 已 经 初 具 规 模 ,但 现 有 的 引文 知识 服务 系统 不 能 很 好 地 揭 
示 引 文 之 间 的 结构 或 关系 ,给 引文 的 获取 、 共 享 和 利用 带 来 一 定 困 难 。[ 方 法 /过 程 ] 以 引文 数据 作为 研究 对 
象 ,对 所 涉及 的 各 种 知识 进行 获取 和 整理 ,探讨 引文 之 间 的 语义 关系 ,构建 科研 人 员 本 体 和 引文 知识 本 体 两 个 


本 体 ,设计 并 初步 实现 引文 知识 服务 原型 系统 。[ 结果 /结论 ] 对 基于 本 体 的 引文 知识 服务 原型 系统 构建 进行 


验证 ,实验 结果 表明 ,基于 本 体 的 引文 知识 服务 原型 系统 基本 实现 预定 的 目标 与 功能 。 
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在 数 以 亿 计 的 知识 资源 中 ,科学 文献 资源 作为 科 
研 大 员 获 取 知 识 、 了 解 科研 动态 的 重要 途径 ,是 知识 伟 
播 的 重要 载体 "。 目 前 ,国内 对 科学 文献 的 组 织 缺乏 
统 当 的 规范 ,也 缺少 智能 的 组 织 工 具 , 更 忽略 了 对 科学 
区 三 资源 进行 层次 化 加 工 。 尽 管 国内 引文 数据 库 建设 
已 经 初 具 规模 ,并 且 被 广泛 使 用 ,但 在 引文 知识 服务 发 
刁 远 程 中 , 当前 科学 文献 资源 的 组 织 方式 和 检索 方式 
使 称 现 有 的 引文 知识 服务 模式 不 能 很 好 地 揭示 引文 之 
间 区 结构 或 关系 ,给 引文 的 获取 .共享 和 利用 带 来 了 一 
定 困难 。 


2 相关 研究 回顾 


国外 对 知识 服务 的 研究 侧重 于 实践 ,形成 了 比较 
丰富 的 研究 理论 及 成 果 。 对 于 知识 服务 系统 的 研发 ， 
早期 有 美国 国家 医学 图 书馆 (US National Library of 
Medicine，NLM ) 的 医学 文献 分 析 和 检索 系统 .美国 国 
立 生 物 技 术 信息 中 心 (US National Center for Biotech- 
nology Information ,NCBI) 的 生物 信息 数据 库 。 如 果 把 
知识 服务 系统 的 定义 拓宽 ,不 止 局 限于 知识 数据 库 、 知 
识 百 科 的 形式 ,维基 百科 .Coogle ,Siri 等 提供 的 服务 都 
可 以 称 为 知识 服务 ,只 是 形式 和 深浅 不 同 。 


国内 对 于 知识 服务 的 研究 , 早 在 2000 年 ,张晓林 
先生 在 《走向 知识 服务 :寻找 新 世纪 图 书 情报 工作 的 生 
长 点 》” 一 文中 便 前 脆性 指出 ,新 时 代 带 来 的 知识 经 济 
与 网 络 数字 化 的 双重 冲击 ,不 仅 要 求 我 们 在 现代 技术 
基础 上 对 图 书 情报 系统 进行 改造 在 更 广泛 和 更 丰富 
的 资源 条 件 下 进行 信息 服务 , 而 且 需 要 我 们 重新 审视 
知识 经 济 和 现代 信息 环境 对 图 书 情报 工作 的 要 求 , 重 
新 定位 核心 能 力 以 及 图 书 情报 工作 的 突破 口 和 生长 
点 


oO 


1999 年 6 月 ,国家 知识 基础 设施 (China National 
Knowledge Infrastructure ,CNKI) 工程 中 国 知 网 ,由 
清华 大 学 与 清华 同方 共同 发 起 ,也 可 称 之 为 文献 知识 
服务 系统 ,具有 较 大 规模 的 文献 知识 服务 系统 还 有 中 
到 工程 科技 知识 中 心 .万 方 等 。 

传统 的 文献 知识 服务 系统 ,大 多 只 是 提供 简单 的 
信息 检索 服务 ,通过 关键 词 等 信息 匹配 的 方式 ,实现 特 
定 知识 资源 与 相应 用 户 的 对 应 关系 ,这 种 方法 虽然 简 
单 ,但 容易 忽略 知识 资源 的 语义 层面 ,造成 大 量 语义 方 
面 知识 资源 的 缺失 ” ;传统 检索 无 法 展示 引文 之 间 的 
引用 层级 .引用 路 径 , 无 法 对 其 根源 及 引用 过 程 进行 追 
溯 ;得 到 的 检索 结果 虽然 可 以 呈现 大 量 文献 ,但 是 不 能 
很 好 地 满足 用 户 的 个 性 化 知识 需求 。 如 今 ,人 们 最 感 
兴趣 的 已 经 不 再 单单 是 知识 资源 本 身 , 而 是 更 加 关注 
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它们 之 间 的 语义 关联 ,但 目前 国内 科学 文献 资源 的 组 
织 模式 依然 过 于 简单 和 单一 ,无 法 实现 语义 检索 。 随 
着 本 体 技术 的 不 断 发 展 ,本 体 的 理念 逐渐 被 应 用 到 知 
识 服务 中 来 ,但 对 引文 知识 服务 的 研究 尚 少 ,也 很 少 有 
学 者 将 其 与 本 体系 统 有 机 地 结合 起 来 ,并 通过 揭示 引 
文 之 间 的 结构 和 语义 关联 来 对 具有 潜在 价值 的 信息 进 
行 挖 掘 ,探讨 引文 之 间 的 语义 关系 ,了 解 引用 路 径 , 从 
而 更 好 地 提供 知识 服务 。 


3 ”基于 本 体 的 引文 知识 服务 原型 系统 


能 设 i 


3.1 ”基于 本 体 的 引文 知识 服务 原型 系统 功能 

科学 文献 作为 科研 人 员 获 取 知 识 的 重要 载体 , 结 
构 化 的 知识 组 织 是 保证 知识 服务 水 平 的 关键 。 在 此 基 
础 下 ,对 引文 知识 服务 展开 研究 ,可 以 帮助 用 户 在 了 解 
引 几 路 径 的 前 提 下 ,定位 并 获取 引用 数据 ,进而 对 数据 
共 鲁 与 重用 起 到 促进 作用 。 
加 本 研究 构建 基于 本 体 的 引文 知识 服务 原型 系统 ， 
引信 语义 关系 、 本 体 这 一 概念 ,提高 引文 知识 服务 质 
蝇 并 在 一 定 程度 上 揭示 引文 之 间 的 结构 或 关系 。 拟 
根据 文献 所 需要 表现 的 层次 结构 功能 等 ,将 文献 的 
知 弄 要 素 和 知识 单元 进行 整合 ,组 织 成 有 一 定 规则 的 
知识 系统 ,将 看 似 杂乱 无 章 的 知识 整合 成 有 序 的 知识 
网 纵 , 本 体 作为 一 种 完整 清晰 的 知识 表示 方式 ,可 将 知 
误 疙 示 延 伸 到 语义 层面 上 ,进而 实现 知识 资源 在 语义 
层 凯 的 表示 。 本 研究 将 对 基于 本 体 的 引文 知识 服务 原 
型 系统 展开 研究 ,构建 科研 人 员 本 体 和 引文 知识 本 体 
两 本体 ,并 对 基于 本 体 的 引文 知识 服务 原型 系统 构 
建 进行 验证 ,包括 基于 本 体 的 知识 导航 、 引 文 层级 展 
示 .引文 路 径 展示 .同门 引用 展示 ,引文 知识 推荐 等 模 
块 。 基 于 本 体 的 引文 知识 服务 原型 系统 在 构建 引文 知 
识 库 的 基础 上 ,提供 知识 展示 ,检索 查询 ,浏览 导航 和 
推荐 等 功能 ,让 用 户 可 以 更 方便 地 获取 所 需 的 知识 。 
本 文 以 引文 知识 服务 原型 系统 的 构建 为 基础 目标 ,最 
终 形成 具有 语义 检索 .知识 导航 .知识 推荐 等 多 方面 知 
识 服务 功能 的 引文 知识 服务 原型 系统 平台 ,为 现 有 的 
图 书馆 知识 服务 提供 新 的 思路 。 基 于 本 体 的 引文 知识 
服务 原型 系统 包括 引文 知识 导航 ,引文 知识 检索 .引文 
知识 推荐 3 个 子 系统 。 
3.2， 引 文 知识 导航 子 系统 

引文 知识 导航 子 系统 主要 利用 科研 人 员 本 体 进行 
分 类 导航 ,采用 了 层级 结构 ,从 内 部 关联 特征 角度 来 揭 
示 资 源 之 间 的 关系 。 本 体 充分 支持 逻辑 推理 并 具有 非 


常 良好 的 概念 层次 结构 ,能 够 对 知识 资源 的 内 部 关联 
关系 进行 充分 揭示 ”。 应 用 本 体 来 构建 引文 知识 导航 
子 系统 , 既 可 以 展示 资源 之 间 的 关系 ,还 可 以 展示 资源 
的 内 部 属性 。 与 传统 分 类 导航 的 线性 知识 组 织 相 比 ， 
基于 本 体 的 引文 知识 导航 子 系统 除了 强调 概念 层级 关 
系 以 外 ,更 加 侧重 于 对 知识 资源 内 部 关联 进行 揭示 ,从 
而 增强 知识 的 语义 表达 ” ,所 构成 的 网 状 结构 使 得 知 
识 的 搜索 更 加 快速 ,定位 更 加 精确 。 

笔者 选用 科研 人 员 本 体 来 构建 引文 知识 导航 子 系 
统 , 可 将 科研 人 员 关 系 按 其 关联 以 层次 化 的 结构 来 呈 
现 给 用 户 。 引 文 知识 导航 子 系统 将 分 为 左右 两 个 模 
块 。 左 侧 模块 为 人 物 目 录 , 通 过 树 形 结构 来 展示 所 有 
的 相关 科研 人 员 ,每 个 科研 人 员 按 照 层 级 结构 排列 展 
示 , 层 级 结构 通过 人 物 前 面 的 加 减 号 标识 来 进行 节点 
的 展开 和 收 起 。 用 户 将 根据 自己 的 兴趣 点 选择 感 兴 
的 科研 人 员 ,通过 层 层 点 击 来 了 解 科研 人 员 的 学 生 、 同 
门 等 关联 信息 。 在 右 侧 框 中 ,用 户 可 以 根据 其 在 左边 
模块 点 击 的 感 兴趣 的 科研 人 员 来 获取 数据 库 中 该 人 员 
的 个 人 信息 (如 姓名 、 出 生日 期 \ 研 究 机 构 、 职 务 、 研 究 
领域 .负责 的 基金 项 目 等 ) 发表 论文 情况 .论文 引用 情 
况 .常用 关键 词 以 及 著作 情况 ,并 且 原 型 系统 会 将 相关 
知识 动态 展示 出 来 。 
3.3 引文 知识 检索 子 系统 

基于 本 体 的 引文 知识 检索 子 系统 ,通过 科研 人 物 
本 体 .引文 知识 本 体 对 引文 资料 进行 组 织 ,对 文献 资源 
进行 语义 标 引 ,通过 分 析 资 源 对 象 , 对 其 进行 知识 分 
类 知识 标 引 、 知 识 描述 及 处 理 等 操作 ,形成 具有 语义 、 
电脑 可 理解 的 元 数据 ,从 而 实现 基于 本 体 的 知识 检 
索 “。 

已 有 的 知识 检索 在 对 检索 结果 的 处 理 上 ,通常 仅 
对 用 户 呈 现 直 接 的 知识 需求 ,缺乏 对 知识 的 语义 关联 
进行 呈现 ,对 科学 文献 资源 的 组 织 模式 依然 过 于 简单 
和 单一 。 但 在 基于 本 体 的 引文 知识 检索 子 系统 中 , 除 
了 能 够 准确 地 匹配 符合 用 户 需 求 的 知识 以 外 ,还 能 够 
输出 所 检索 文献 的 引文 和 引用 层级 ,并 且 使 得 引用 关 
系 和 引用 路 径 一 目 了 然 。 此 外 ,还 通过 语义 推理 来 实 
现 同门 、 师 门 之 间 互 引 关系 的 展示 , 见 图 1。 
首先 ,用 户 提 出 检索 需求 。 系 统 会 根据 用 户 的 检 
索 表达 式 来 进行 预 处 理 操作 ,根据 预 处 理 结果 将 检索 
所 需要 的 关键 词 进行 封装 ,成 为 节点 对 象 ( 此 时 的 检索 
式 会 被 转换 成 系统 可 理解 的 某 种 特定 检索 式 ) ,检索 式 
由 功能 层 向 逻辑 层 传送 。 此 后 ,该 检索 式 还 会 通过 语 
义 扩 展 、 推 理 等 流程 ,被 变换 成 全 新 的 检索 式 ; 接 下 来 ， 
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检索 请 求 
关键 词 提取 
封装 成 节点 对 象 
科研 人 员 节点 查询 -一 > 引文 
知识 库 知识 库 
| 


引文 知识 
本 体 库 


知识 

组 织 
科研 人 员 检索 结果 显示 
本 体 库 | 


用 户 界 面 


本 


~ 1 基于 本 体 的 引文 知识 检索 子 系统 示意 


对 十 装 后 的 节点 展开 查询 ,并 同 本 体 库 进 行 映射 ,进行 
敌 测 抽取 ,并 正确 输出 结果 ;最 后 ,对 输出 的 结果 进行 
排 贸 。 将 最 终 的 结果 传递 回 功能 层 , 并 在 用 户 操作 界 
面 了 上 加 以 呈现 。 
3 引文 知识 推荐 子 系统 
和 本体 是 一 种 概念 化 的 明确 的 形式 规范 ”。 本 体 主 
要 用 于 建立 关于 用 户 背景 ,项 目 知识 和 领域 知识 的 知 
误 模 型 。 在 基于 本 体 的 引文 知识 推荐 子 系统 中 ,本 体 
则 改 用 来 进行 知识 表示 。 由 于 网 络 学 习 资 源 在 万 维 网 
记 蜂 指数 级 增长 , 另 一 方面 ,网 络 学 习 者 在 信息 超载 的 
情 耽 下 ,难以 选择 满足 需求 的 最 适合 的 相关 资料 。 随 
着 到 联网 的 出 现 , 由 于 信息 过 载 ,从 信息 海洋 中 选择 有 
用 曾 信 息 成 为 一 个 巨大 的 挑战 唐 。 引 文 推荐 可 以 根据 
学 习 者 的 个 人 喜好 和 个 人 资料 自动 向 用 户 推荐 最 具有 
关联 性 的 引文 资源 ,从 而 克服 这 些 问题 。 然 而 ,与 传统 
搜索 引擎 及 其 他 返回 与 用 户 查 询 匹配 的 相关 结果 的 检 
索 系统 不 同 ,推荐 系统 针对 用 户 需求 和 偏好 量 身 定制 
个 性 化 建议 ,在 电子 商务 和 电子 学 习 等 领域 发 挥 重要 
作用 外。 

引文 知识 推荐 子 系统 的 主要 目标 是 帮助 用 户 找到 
满足 其 需要 的 有 用 知识 。 在 传统 的 推荐 系统 中 ,通常 
是 基于 评级 的 用 户 推荐 系统 。 在 笔者 设计 的 引文 知识 
推荐 子 系统 中 ,会 将 用 户 特征 等 附加 信息 用 于 用 户 的 
个 性 化 推荐 中 。B，Vesin 等 "指出 ,推荐 系统 的 电子 
学 习 需 要 考虑 学 习 者 的 具体 要 求 ,考虑 特定 用 户 的 特 
征 越 来 越 重 要 。K， Verbert 等 中 强调 在 推荐 过 程 中 纳 
入 有 关 学 习 者 教师 及 其 背景 的 其 他 信息 的 重要 性 ,可 
以 通过 使 用 知识 结构 (如 本 体 ) 个 性 化 学 习 者 资料 , 适 
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应 学 习 者 的 需求 和 特征 ,来 降低 学 习 资 源 推荐 的 复杂 
性 。 引 文 知识 推荐 子 系统 会 根据 用 户 感 兴 趣 的 科研 人 
员 情 况 , 向 其 推荐 相关 论文 或 是 其 经 常 引用 的 论文 。 
该 子 系统 还 会 向 用 户 推荐 其 感 兴趣 的 科研 人 员 的 老 
师 ,学 生 或 者 同门 所 发 表 的 论文 。 此 外 ,该 子 系统 还 会 
将 知识 推荐 的 结果 用 列表 、 图 形 等 多 样 化 方式 加 以 呈 
现 ,充分 展示 论文 与 论文 .作者 与 论文 等 之 间 的 相关 
性 ,增强 原型 系统 的 互动 性 。 


4 基于 本 体 的 引文 知识 服务 原型 系统 


的 关键 技术 
4.1 科研 人 员 本 体 知识 库 构建 

基于 本 体 构建 的 引文 知识 服务 原型 系统 为 知识 共 
享 提供 了 广阔 的 发 展 空 间 ,不 断 挖掘 新 知识 ,促进 知识 
创新 。 

笔者 构建 科研 人 员 本 体 的 目的 有 4 个 :中 提供 科 
研 人 员 相 关 资 料 的 可 视 化 展示 功能 。 在 本 论文 中 , 笔 
者 以 马 费 成 教授 为 例 来 创建 科研 人 员 本 体 实例 ,形成 
以 马 费 成 教授 为 中 心 的 相关 知识 链接 ,其 中 会 涉及 到 
科研 人 员 的 个 人 概况 科研 关系 、 科 研 领域 .著作 等 信 
息 。@) 提 供 一 定 的 语义 检索 功能 。 构 建 人 物 关 系 本 体 
目的 之 一 是 要 提升 用 户 体验 ,在 可 视 化 展示 的 同时 还 
能 够 提供 语义 检索 功能 ,从 而 更 加 满足 用 户 需 求 。 
@@ 提 供 知识 导航 功能 。 通 过 应 用 本 体 技术 来 构建 科研 
人 员 导 航模 块 ,进行 可 视 化 呈现 ,将 科研 人 员 及 其 相关 
论文 按照 某 种 关联 和 层次 结构 来 加 以 呈现 。 由 提供 语 
义 推 理 .知识 挖掘 功能 。 挖 气 显 隐 性 知识 是 基于 本 体 
的 引文 知识 服务 原型 系统 的 重要 目标 。 例 如 ,可 以 实 
现 科 研 人 员 同 门 互 引 、 师 门 引用 的 展示 。 
4.1.1 科研 人 员 元 素 的 收集 与 整理 本 论文 以 马 费 
成 教授 为 例 ,建立 科研 人 员 本 体 。 科 研 人 员 关 系 资料 
也 围绕 马 费 成 教授 进行 搜集 和 整理 。 针 对 马 费 成 教授 
相关 资料 的 搜集 主要 从 以 下 3 个 方面 来 进行 : 

(1) 基 本 信息 。 人 物 的 基本 信息 主要 参照 武汉 大 
学 信息 管理 学 院 官 方 网 站 "上 列 出 的 马 费 成 教授 介 
绍 资料 ,包括 姓名 出 生日 期 性别、 职务、 研究 机 构 、 研 
究 领 域 \. 开 设 课程 科研 项 目 ,社会 任职 等 基本 信息 。 

(2) 人 员 关 系 。 通 过 对 人 物 关系 的 搜集 和 整理 ， 
可 以 充分 展示 人 物 论 文 的 引用 关系 和 合 著 等 关系 。 人 
物 关系 主要 包括 学 生 、 导 师 、 同 事 等 3 种 关系 。 其 中 ， 
学 生 .导师 .同门 等 资料 的 搜集 主要 来 自 武 汉 大 学 信息 
管理 学 院 所 发 布 的 博 硕 士 毕业 论文 题名 目录 ,同事 关 
系 资料 搜集 则 参照 武汉 大 学 信息 管理 学 院 官 方 网 站 所 
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发 布 的 教师 网 页 。 
(3) 论 著作 品 。 马 费 成 教授 论著 作品 资料 的 数据 
来 源 是 CSSCI 引文 数据 库 。 笔 者 选择 “作者 ”字段 ,以 
“ 马 费 成 "作为 检索 词 ,共计 检索 出 153 篇 文献 。 接 着 ， 
将 这 些 文献 的 题 录 信息 以 及 引文 信息 下 载 下 来 ,保存 
到 数据 库 中 。 同 时 ,为 了 展示 更 多 的 引用 关系 及 其 他 
关联 关系 ,笔者 从 CSSCI 数据 库 中 还 下 载 了 李纲 ( 马 费 
成 教授 的 学 生 兼 同事 ) . 查 先进 ( 马 费 成 教授 的 学 生 兼 
同事 ) . 罗 琳 ( 马 费 成 教授 的 学 生 兼 同事 ) \ 安 璐 (李纲 
教授 的 学 生 兼 同事 ) 等 科研 人 员 的 论文 题 录 信息 及 其 
引文 信息 ,并 且 将 其 导入 到 数据 库 中 。 
4.1.2 确定 核心 概念 集 “笔者 通过 对 科研 人 员 要 素 
进行 分 析 , 发 现 核心 概念 大 致 包含 人 物 ,事件 .时 间 .地 
点 一 笔者 在 构建 科研 人 员 本 体 时 ,主要 以 马 费 成 教授 
这 寂 人 物 为 中 心 ,并 结合 马 费 成 教授 的 经 历 .成 就 等 情 
沥 来 加 以 充分 考虑 ,增加 了 著作 和 文章 两 个 新 类 。 其 
入 信物 类 是 科研 人 员 本 体 的 主要 类 ,其 他 5 个 类 则 是 
类 。 本 论文 中 涉及 到 的 6 个 类 的 概况 简 述 如 下 : 
国人 物 类 。 在 本 论文 中 ,人 物 (Person) 类 特 指 马 费 成 
载 报 的 相关 人 物 关 系 , 个 人 意义 较为 突出 。@ 事 件 类 。 
论文 中 ,事件 (Event) 类 是 指 与 人 物 主体 有 关 的 一 
系列 活动 , 它 与 人 物 . 著 作 、 时 间 、 地 点 .文章 等 都 有 关 
联 洲 8 著作 类 。 在 本 论文 中 ,著作 (Publica- 
ti 本 类 特 指 与 人 物 有 关 的 著作 ,在 本 例 中 是 
搬 取 文 章 以 外 的 书籍 类 著作 。@ 文 章 类 。 


所 示 : 
站 ”人 物 信息 
著作 
FL 人物 上 | 人 物 论 著 学 生 
一 |_ 相关 关系 导师 
站 求学 二 | 同事 
有 E 件 任教 
写作 
二 让 KR] | | 者 作 | -| 任 纺 委 
体 概念 柳 型 | 期 刊 文章 
-二 文章 | 一 | 硕士 论文 
一 事件 发 生 时 间 
-| 时 间 上 | 毕业 时 间 
论文 发 表 时间 
-| 著作 出 版 时 间 
二 地 点 
图 2 ”科研 人 员 本 体 概念 层次 模型 示意 
4.1.4 确定 类 的 属性 类 的 属性 分 为 对 象 属性 和 数 


据 属性 。 对 象 属性 用 于 表示 概念 与 概念 之 间 的 关系 ， 
既 可 以 表示 相同 概念 间 的 关系 ,也 可 以 表示 不 同 概念 
间 的 关系 。 例 如 , “人物” 发 表 “ 期 刊 文章 ”, 是 “人 
物 与 "文章 "的 关系 六 学 生 " 是 "人物 "的 对 象 属性 , 指 
的 是 "人物 "类 中 的 两 个 实例 之 间 的 茶 种 关系 ;数据 
性 指 的 是 概念 的 内 在 属性 ,如 "姓名 一 研究 领域 "等 了 
为 数据 属性 ,描述 的 是 本 质 特征 。 科 研 人 员 本 体 的 
性 设置 示意 图 如 图 3 所 示 : 


省 融 


el 


在 全 论文 中 ,文章 (Aniqle) 关 是 指 人 物 所 发 7 


文章 .文章 的 引文 以 及 其 他 相关 资料 。 
时 间 类 。 在 本 论文 中 ,时 间 (Time) 类 与 其 
他 类 都 有 关联 ,代表 事件 发 生 的 时 间 。@ 地 
点 类 。 在 本 论文 中 ,地 点 (Place) 类 是 指 事件 
发 生 的 地 点 ,与 其 他 类 均 有 关联 。 

4.1.3 


时 间 


著作 
书 名 、 作 者 、 译 者 、 


人 物 
姓名 、 出 生日 期 、 性 别 、 职 务 、 研 究 
领域 、 科 研 项 目 、 曾 获奖 项 、 学 生 、 
导师 、 同 事 、 机 构 
会 
到 下 | 事件 
上 ER 毕业 于 、 发 表 、 任 编 委 于 、 主 持 (项 目 ) 
文章 SN 


来 源 篇 名 、 来 源 作 者 、 基 金 名 称 、 基 金 编号 、 
期 刊 名 称 、 中 图 类 号 、 年 度 郑 期、 关键 词 、 
参考 文献 


人 员 本 体 中 ,人 物 类 被 进一步 细 分 为 个 人 信 


确定 概念 之 间 的 层次 关系 ”在 科研 en 出 版 社 、 出 版 


PA 


息 、 人 物 论著 、 相 关 关系 等 3 个 子 类 。 其 中 ， 
人 物 论著 包括 著作 和 文章 ,相关 关系 包括 导 

师 \ 学 生 和 同事 ,相关 关系 包括 求学 、 任 教 \. 任 编 委 、 写 
作 等 4 个 子 类 。 著 作 类 是 指 人 物 主体 所 发 表 的 相关 著 
作 。 文 章 类 包括 两 个 子 类 , 即 期 刊 文章 和 硕士 论文 ,其 
中 的 期 刊 文章 将 映射 到 引文 知识 本 体 上 。 时 间 类 根据 
本 体 需要 进一步 细 分 为 事件 发 生 时 间 .毕业 时 间 论文 
发 表 时 间 ,著作 出 版 时 间 等 4 个 子 类 。 

如 果 按 照 上 述 层 次 将 主体 类 与 辅助 类 的 层次 结 
构 进 一 步 细 分 , 则 会 得 到 其 层次 模型 示意 图 ,如 图 2 


一 


图 3 本 体 概念 属性 设置 示意 


4.2 引文 知识 本 体 智 识 库 构建 

“引文 知识 本 体 " 这 一 概念 的 内 涵 是 提取 便于 理 
解 \ 有 共识 的 引文 元 素 , 并 构建 出 方便 简单 .适用 于 传 
统 引文 分 析 的 引文 本 体 ,并 且 以 机 器 可 读 的 模式 组 织 、 
存储 查询 引文 数据 ,更 好 地 进行 知识 服务 ” 。 

引文 知识 本 体 研究 的 对 象 是 引文 资源 元 数据 , 引 
文 资源 分 布 存 储 ,使 得 资源 语义 化 变 得 比较 困难 。 以 
中 文 期 刊 引文 数据 库 为 例 ,包括 中 文 社 会 科学 引文 索 
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图 二 情报 三 作 


第 63 卷 第 2 期 2019 年 1 月 
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引 (CSSCI) .中 国 科学 引文 数据 库 (CSCD ) 等 多 种 引文 
数据 库 。 在 不 同 数据 库 中 , 标 引 字段 与 著录 格式 各 有 
不 同 。 在 本 研究 中 ,笔者 选取 的 是 权威 性 和 质量 均 较 
高 的 CSSCI 数据 库 作为 数据 来 源 。CSSCI 引文 库 中 包 
含 13 个 标 引 字段 , 即 来 源 篇 名 、 来 源 作 者 、 英 文 篇 名 、 
期 刊 . 基 金 .机 构 名 称 、 第 一 机 构 \ 第 一 作者 《中 国 图 书 
馆 分 类 法 》 分 类 号 (以 下 简称 "中 图 类 号 ” ) ,年 代 卷 期 、 
关键 词 .基金 类 别 .参考 文献 。 笔 者 根据 有 效 保留 语义 
的 原则 ,对 以 上 字段 进行 了 统一 、 合 并 和 删改 等 预 处 理 
操作 。 例 如 ,将 "第 一 作者 "等 删 掉 ,将 "基金 类 别 " 定 
义 为 "基金 ”, 将 其 中 的 实体 、 关 系 转化 为 本 体 定义 的 
类 ,属性 ,如 图 4 所 示 : 


= 


生年 代 卷 其 
™ GE 
会 文 Es 
一 RE 
[aaa 
RR 生生 IT 

© eR 

HO \ 
CN 

SS BE 


> 4 引文 知识 本 体 基本 类 目 体系 


>< 为 了 丰富 引文 知识 服务 系统 的 功能 ,还 
可 必 面 向 引文 知识 服务 原型 系统 的 实际 需 
求 5 定义 私有 类 和 私有 属性 。 此 外 , 还 需要 
定 扩 引 文 类 ,添加 引文 数量 .被 引 数量 .引文 
文献 细节 被 引文 献 细 节 等 。 在 定义 文章 类 
时 ,需要 添加 中 图 类 号 .关键 词 . 文 章 类 型 
等 ;在 定义 基金 类 时 ,主要 参考 的 是 国家 社 
会 科学 基金 项 目 数据 库 , 将 基金 类 进一步 细 
化 为 项 目 批准 号 .项 目 名 称 、 项 目 类 别 \ 项 目 
学 科 分 类 项目 立 项 时 间 、 项 目 负责 人 、 项 目 
成 果 ; 在 定义 期 刊 类 时 , 主要 添加 期 刊 主页 
等 信息 ;在 定义 机 构 类 时 ,主要 添加 所 在 省 
区 机构 主页 等 信息 。 最 终 形成 的 引文 知识 本 体 类 目 
体系 见 图 5。 

4.3 ”本体 数据 存储 与 映射 

为 了 对 上 层 引 文 知识 服务 功能 予以 支持 ,可 以 根 
据 数 据 获取 和 调用 等 性 能 来 选择 本 体 的 存储 机 制 。 
目前 ,尽管 已 有 许多 专业 的 数据 库 可 以 支持 RDF 数据 
存储 ,如 Virtuoso、Jena、Fuseki 等 ,但 对 于 RDF 数据 的 
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关联 检索 则 需要 从 路 径 长 度 为 0 开始 考虑 正 向 和 反问 
关系 迭代 来 构造 复杂 的 SPARQL 查询 语句 ” 。 当 相 
关 信 息 变 得 复杂 时 ,查询 效率 会 变 得 非常 低 。 为 了 实 
现 引 文 知 识 服务 功能 ,笔者 依据 图 论 思想 ,选择 一 种 以 
图 结构 为 基础 的 图 数据 库 来 储存 本 体 , 仅 需要 获取 多 个 
节点 和 关系 边 ,就 可 以 轻松 获取 概念 之 间 的 语义 路 径 。 

在 对 关联 数据 的 处 理 上 ,图 数据 库 具 有 更 加 明显 
的 优势 。 图 数据 库 通过 节点 和 边 来 保存 数据 。 其 
中 ,实体 通过 节点 来 进行 表示 ,实体 之 间 的 关系 通过 边 
来 表示 。 目 前 , 比较 常用 的 图 数据 库 主要 有 :Neo4j、 
Trinity 、DEX 、InfiniteCraph 、HyperCraphDB 、Allegro- 
Graph。 其 中 ,Neo4j 数据 库 的 性 能 优势 明显 ,已 经 引起 
了 人 们 的 更 多 关注 。Neo4j 是 NOSQL 数据 库 中 的 一 
种 ,主要 用 来 对 结构 化 数据 进行 存储 ,形成 数据 网 络 。 
在 本 研究 中 ,笔者 选择 Neo4j 来 对 本 体 进行 存储 ,通过 
构建 Cypher 查询 语句 ,并 且 利 用 Neo4j 所 提供 的 所 有 
路 径 、 最 短路 径 、 最 长 路 径 等 图 算法 ,实现 了 引文 知识 
服务 的 相关 功能 。 

在 Neo4j 中 对 “ 马 费 成 "个 人 信息 中 的 要 素 进 行 映 
射 时 ,最 终 形成 的 结构 关系 图 如 图 6 所 示 。 该 图 展示 
了 马 费 成 教授 的 相关 个 人 信息 要 素 , 包 括 :科研 项 目 、 
研究 领域 ,教授 课程 .毕业 论文 .导师 信息 等 。 从 中 可 
以 看 出 , 马 费 成 的 导师 是 严 怡 民 , 他 的 同门 有 马 大 川 、 
匡 兴 华 等 。 

[CE ore] 


| 


' == 
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5 引文 知识 本 体 类 目 体系 


当 人 物 关 系 本 体 中 所 有 的 类 、 属 性 、 实 例 全 部 
映射 到 Neo4j 中 ,将 会 以 图 形 的 模式 存储 到 数据 库 
中 ,可 以 看 到 可 视 化 形式 的 节点 与 关系 。 图 7 中 显 
示 的 是 部 分 来 源 文献 和 引用 文献 的 存储 结构 示意 
图 ,展现 了 马 费 成 教授 的 部 分 文章 与 文章 之 间 的 引 
用 关系 。 
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5.1 引文 语义 检索 功能 的 实现 

在 本 研究 中 ,笔者 采用 深度 优先 搜索 策略 。 当 用 
户 检索 引文 的 某 些 要 素 时 ,系统 会 按照 检索 要 求 输出 
相应 的 关联 信息 。 


5.1.1 C-path(x) 语 义 检索 C-path(x) 引 文 路 径 检索 
是 指 以 开始 节点 作为 单 节 点 的 语义 检索 。 例 如 , 当 用 
户 想 要 查询 《科学 知识 网 络 中 的 链 路 预测 研究 述评 》 
这 篇 文章 的 信息 时 ,就 可 以 在 开始 节点 处 输入 “科学 知 
识 网 络 中 的 链 路 预测 研究 述评 ”, 检 索 结果 见 图 8。 
同时 ,还 可 以 获得 一 个 更 加 生动 的 可 视 化 结果 。 
可 视 化 检索 样 例如 图 9 所 示 。 从 中 可 以 清楚 地 看 到 与 
该 文章 相关 的 其 他 信息 (如 作者 ,期 刊 信息 、 基 金 信息 、 
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关键 词 等 ) 。 
5.1.2 引用 层级 及 引文 要 素 展 示 “ 当 给 出 一 篇 文章 
时 ,系统 会 根据 用 户 指 定 的 层 数 来 输出 引文 的 引用 层 
级 ,所 有 引用 关系 一 目 了 然 。 例 如 ,如果 用 户 想 要 检索 
《我 国 国家 安全 情报 体系 构建 及 运作 》 一 文 ,并 且 在 
“ 层 数 " 中 输入 3 , 则 会 得 到 如 图 10 所 示 的 检索 结果 。 
当 用 户 单 击 系统 右上 角 的 “显示 标签 云 " 按钮 时 ， 
将 会 出 现 ( 我 国 国家 安全 情报 体系 构建 及 运作 》 一 文 
所 有 引文 的 所 有 关键 词 所 构成 的 标签 云图 。 此 时 ,如 
有 果 用 户 单 击 其 中 的 某 个 标签 ,将 会 显示 该 标签 在 引文 
中 出 现 的 次 数 。 例 如 ,车 用 户 单 击 “ 国 家 安全 战略 ”， 
则 会 显示 该 关键 词 出 现 了 两 次 ( 见 图 11)。 引 文 的 关 
键 词 能 够 反映 引用 文献 的 主题 ,从 而 在 一 定 程度 上 体 
现 来 源 文献 的 主题 ， 引 文 标签 云 的 设计 可 以 帮助 用 户 
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盘 堆 确 地 了 解 所 感 兴趣 文章 的 主题 及 其 与 其 他 文章 的 
关联 性 。 

5 加 为 ”Cpath(x,y) 引文 路 径 检索 C-path(x,y) 引文 
中 做 检索 指 的 是 在 节点 之 间 进 行 引文 路 径 检索 。 例 
婚 当 用 户 以 “知识 网 络 的 演化 焉 连接 机 制 "作为 起 始 
节 址 ,以 * 知 识 网 络 的 演化 工 增长 与 老化 动态 " 作为 终 
区 力 点 ,路径 长 度 选 择 为 2 ,最终 得 到 的 检索 结果 如 图 
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知 闪 国 交 失 江 做 亿 汗 接 认 划 志 | 有- 的 演化 I 增长 老化 与 知识 产生 时 点 的 关系 -引用 


图 12 路 径 长 度 为 2 的 引文 路 径 长 度 的 检索 结果 


5.1.4 人 物 关 系 路 径 检索 “” 当 用 户 想 要 了 解 两 个 人 
物 之 间 的 关系 时 ,本 原型 系统 可 以 从 多 方面 .多 角度 来 
进行 分 析 , 帮 助 用 户 更 全 面 、 更 系统 地 了 解 各 种 人 物 关 
系 。 该 功能 以 人 物 要 素 作 为 起 始 节 点 ,展现 了 人 物 之 
间 的 语义 路 径 关 系 。 例 如 ,如 果 用 户 以 “ 马 费 成 "作为 
起 始 节点 ,以 " 安 璐 "作为 终止 节点 ,最 终 得 到 的 人 物 
关系 路 径 检索 结果 如 图 13 所 示 : 
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图 13 人 物 关 系 路 径 检索 结果 


通过 对 上 述 语义 路 径 做 进一步 分 析 , 就 可 以 了 解 
“ 马 费 成 "和 “ 安 璐 ”这 两 个 人 物 要 素 之 间 存 在 的 语义 
路 径 。 例 如 ,图 13 中 最 后 一 条 路 径 的 含义 概述 如 下 : 
篇 文章 《科学 知识 网 络 中 的 链 路 预测 研 

述评 》 引 用 了 马 费 成 教授 发 表 的 《知识 网 络 的 结构 

tn 
5.1.5 同门 互 引 关系 展示 ”利用 语义 推理 功能 ,本 原 
型 系统 可 以 实现 同门 之 间 、 师 门 之 间 的 互 引 关系 展示 ， 
见 图 14。 

从 图 14 可 知 , 当 用 户 以 “ 张 斌 ”作为 检索 对 象 时 ， 
就 可 以 了 解 到 : 陈 潇 俊 、 李 亚 婷 、. 苏 小 敏 ` 赵 红 斌 、 付 真 
真 `. 望 俊 成 , 刘 向 、 王 晓 光 等 都 是 马 费 成 教授 的 学 生 。 
又 如 ,在 同门 引用 中 , 张 斌 分 别 引用 了 这 些 人 发 表 的 文 
草 。 在 师 门 引用 中 ,展示 的 则 是 张 斌 引用 了 其 老师 马 
费 成 教授 发 表 的 所 有 文章 。 
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看 中 ,如 采用 户 想 要 检索 茶 篇 文章 ， 


该 文章 将 被 保存 到 该 用 户 的 检索 记录 中 。 此 后 ,原型 
系统 会 根据 用 户 的 检索 记录 进行 推荐 。 推 荐 的 顺序 依 
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中 出 现 次 数 最 多 的 文章 推荐 给 用 户 ;(3 将 用 户 感 兴趣 
文章 的 作者 的 其 他 文章 推荐 给 用 户 。 其 中 ,文章 的 出 
现 次 数 越 多 ,相应 的 字体 就 会 越 大 ,位 置 越 靠 前 ,从 而 
帮助 用 户 找 到 最 满足 其 需求 的 文章 。 引 文 知识 推荐 示 
意图 见 图 19。 
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18 马 费 成 人 物 关 系 标 签 可 视 化 展示 示意 


基于 本 体 的 引文 知识 服务 研究 是 在 知识 资源 的 重 
要 性 日 益 凸 显 、 知 识 服 务 的 水 平 受到 越 来 越 多 重视 的 
背景 下 展开 的 。 科 学 文献 作为 科研 人 员 获 取 知 识 的 重 


要 载体 ,结构 化 的 知识 组 织 是 保证 知识 服务 水 平 的 关 
键 所 在 。 通 过 对 引文 知识 服务 进行 研究 ,可 以 帮助 用 
户 在 了 解 引 用 路 径 的 前 提 下 ,定位 并 获取 引用 数据 , 进 
而 对 数据 共享 与 重用 起 到 促进 作用 。 
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文章 名 | 网站 信息 失效 过 程 中 余 留 价值 测度 


【作者 】， 苏 小 避 ” 陈 欢 张 试 马 凡 成 
【年 代 卷 期 】，2012, 30(120) :1761-1766, 1772 
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【引文 】， nr 作业 的 天 证 二 关 广 意 力 与 网 络 信息 价值 测度 研究 ”信息 价值 测度 的 广 意 力 模型 ”Pareto/NBD 模 型 在 网 络 信息 失效 判别 分 析 中 的 探索 性 研究 ”信息 生命 周期 研究 


述评 (1 ) 一 一 价值 视角 


推荐 文章 


et De 型 任 网 | 络 信息 失效 判别 分 机 中 的 控 索性 研究 


网 络 信息 RF 分群 管 理 模式 研究 由 
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失效 学 的 哲学 理念 及 其 应 用 探讨 “信息 生命 周期 研究 述评 | 


我 国信 息 政 策 体 系 结构 人 研究 


07.0061 7 


理论 与 实践 相 结 合 的 理念 ,从 理论 学 习 
1 出 Praf 员 本 体 和 引文 知识 本 体 、 设 计 和 构建 知识 
属于 展 实证 研究 等 多 个 方面 对 基于 本 体 的 引文 知识 
服务 进行 了 深入 研究 。 笔 者 根据 本 体 构建 的 目标 和 系 
统 需求 ,构建 了 科研 人 员 本 体 和 引文 知识 本 体 ,描述 了 
其 固体 构建 流程 ;将 本 体 映 射 到 图 数据 库 中 ,并 且 给 出 
工 垂体 与 数据 库 之 间 的 映射 规则 ;完成 了 基于 本 体 的 
3 的 知识 服务 原型 系统 的 设计 实现 了 基于 本 体 的 知 
识 导航 .引文 层级 展示 .引文 路 径 展 示 .引文 知识 
等 多 种 功能 。 实 验 结果 表明 ,基于 本 体 的 引文 知识 有 
务 原型 系统 基本 上 实现 了 预定 的 目标 与 功 ne 
果 良 好 。 
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Design and Implementation of Ontology -based Citation Knowledge Service Prototype System 
Wang Shanshan' Chen Chen” Xiao Ming 
!' School of Government, Beijing Normal University, Beijing 100875 
? Smart City Construction Office, Cangzhou Government, Cangzhou 061000 

Abstract: [ Purpose/significance | For now, the construction of domestic citation database had already begun to 
take shape. In the development of citation knowledge services, the current organization and retrieval methods of scientific 
I resources make the current citation knowledge service model unable to reveal the structure or relationship be- 
tween citations, which caused difficulties for the acquisition, sharing and utilization of citations. [ Method/process | This 
paper took citation data as the research object, acquired and sorted all kinds of knowledge and explored the semantic rela- 
tiewship between citations. Two ontology named “ scientific researcher ontology” and “citation knowledge ontology” were 
cbnsiructed ， and an ontology-based citation knowledge service prototype system was designed and implemented. |[ Result/ 
coialusion] Conducts empirical research on the construction of ontology-based citation knowledge service system ，The re- 
sroves that the ontology-based citation knowledge service system has the expected goals and functions. 


Keywords: ontology knowledge service prototype system citation 
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起 发 布 当年 及 前 两 年 高 被 引 论文 TOP10。 自 2019 年 起 《图 书 情报 工作 》 将 评选 优秀 论文 ,以 中 国 知 网 检 
索 到 由 前 5 年 发 表 的 高 被 引 和 高 下 载 论文 各 年 TOP50 为 基础 ,兼顾 发 表 时 间 ,由 编辑 部 最 后 选 定 优秀 论文 20 篇 进行 公布 ( 见 
下 哎 ) 。 被 选 定 的 优秀 论文 第 一 作者 将 获得 由 《图 书 情报 工作 》 杂 志 社 颁发 的 优秀 论文 证 书 , 并 赠送 全 年 期 刊 论文 电子 版 。 
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